查看原文
其他

云数据仓库 TOP 10

云头条 2021-04-27
Forrester按照评估云数据仓库供应商的26个标准,评出了13家最重要的供应商:阿里巴巴、AWS、Cloudera、Exasol、谷歌、IBM、Micro Focus、微软、Oracle、SAP、Snowflake、天睿和Yellowbrick,并对它们进行了研究、分析和评分。该报告表明了每家供应商相比如何,并帮助企业架构专业人员选择适合自身需求的供应商。

云数据仓库帮助加快现代分析并降低成本


如今,云数据仓库(CDW)解决方案在改变我们交付现代分析工具的方式。它们可在几分钟内提供任何规模的数据仓库、自动调优查询、根据需求扩展计算和存储等资源,并自动升级到最新版本。为满足市场对集成度更高的实时自助式分析工具越来越高的需求,CDW供应商继续专注于以下方面:直接与数据湖和对象存储集成,自助服务以简化更庞大更复杂仓库的访问和管理,以及并行处理、压缩、分区、索引、查询优化和动态资源配置等方面的高级功能。最常见的CDW使用场景包括:客户分析、基于AI/机器学习的分析、针对特定垂直领域的分析以及实时分析。

由于这些趋势,云数据仓库客户应物色提供以下内容的供应商:

  • 简化数据仓库部署的解决方案。从数据寻找新的洞察力是个迭代、持续、繁琐的过程,需要可以扩展的数据仓库。要寻找这种解决方案:拥有更丰富的自动化功能,可使数据摄取、查询调优、数据处理和数据集成实现自动化,以加快支持各种业务使用场景。

  • 可满足你在性能和规模方面需求的解决方案。你开始存储和处理大量数据时,性能和规模变得至关重要。要寻找这种解决方案:每秒可支持数千个并发用户和查询,并提供根据业务需求扩大或减小规模的功能。如果存储和处理的数据超过100TB,面对的并行用户超过100个,要求供应商提供客户案例。

  • 与你的云愿景一样大胆的路线图。大多数供应商让非技术用户能够直接访问数据,继续简化解决方案。要寻找这种供应商的路线图:致力于与数据湖和对象存储集成,支持AI和机器学习自动化功能,加强与各个云SaaS来源的集成,并直接支持增强的分析功能。


评估摘要


Forrester Wave™评估报告着重介绍了领导者、强劲表现者、竞争者和挑战者。它评估了市场上的主要供应商,并不代表整个供应商生态圈。

Forrester的初衷是该评估仅作为一个起点,鼓励客户使用基于Excel的供应商比较工具查看产品评估并调优标准权重。

Forrester Wave™云数据仓库,2021年


Forrester Wave™云数据仓库,2018年


Forrester Wave™:云数据仓库记分卡,2021年


供应商产品




领导者



谷歌在各个行业垂直领域发展势头迅猛。

Google BigQuery是一款全面管理的serverless云数据仓库,使用列存储,扩展后可支持数百PB,利用标准SQL。BigQuery与Cloud BigTable、Google Cloud Storage、Cloud AI Notebooks和Google Sheets集成,让用户能够跨各系统结合数据。数据工程师可使用Spark、Dataflow及其他处理工具,访问BigQuery的存储层,进一步统一谷歌的数据生态系统。BigQuery有内置的机器学习功能,以便使用SQL查询来创建和执行机器学习模型。你可以使用Cloud Console命令行工具,或者使用Java、.Net或Python来访问REST API。

客户喜欢谷歌发布新数据仓库的频次、业务价值、适应未来需要的架构、高端规模、地理空间功能、强大的AI/机器学习功能、良好的安全功能以及广泛的分析使用场景。主要的使用场景包括:商业智能(BI)加速、物联网分析、客户智能、基于AI/机器学习的分析、数据科学、数据协作以及数据服务。


AWS的Amazon Redshift继续得到迅猛采用。

Amazon Redshift是一款成熟的云数据仓库,拥有广泛的功能和日益壮大的生态系统。它是一款全面管理的PB级数据仓库,是AWS Analytics Services的一部分,包括Amazon Kinesis、Amazon Elasticsearch Service、 Amazon CloudSearch、Amazon EMR、Amazon Athena、Amazon SageMaker和AWS Glue。Amazon Redshift可将结果保存回到S3数据湖中,可被其他分析服务所使用,比如Amazon EMR、Amazon Athena和Amazon SageMaker。Amazon Redshift的联合查询跨数据仓库、数据湖和数据库统一分析。

客户喜欢AWS的数据湖集成、与Postgress兼容、大规模性能、serverless架构、安全及合规、高可用性以及灾难恢复等功能。主要的使用场景包括:BI、数据服务、基于AI/机器学习的分析、数据科学以及客户智能。


微软的Azure Synapse Analytics继续得到迅猛采用。微软Azure Synapse Analytics是一种分析服务,将数据仓库、数据集成、实时运营分析和数据分析结合起来,提供一种统一的体验,借助单一的云服务为BI和机器学习使用场景摄取、探索、准备、管理和提供数据。关键的服务组件包括:面向数据仓库工作负载的serverless专用SQL引擎、面向大数据处理的Apache Spark、面向ETL的无代码数据集成,以及面向实时运营分析的Synapse Link。这种分布式云原生横向扩展型的关系SQL数据仓库可存储各种数据,以支持各种分析场景。

客户喜欢微软的产品功能、技术支持、易用性、可扩展性、可用性以及容易吸引有技能的人才。主要的使用场景包括BI加速、客户智能、基于AI/机器学习的分析、数据仓库现代化、风险分析、数据协作以及数据服务。


天睿的Vantage可在大规模环境下提供分析。天睿Vantage是一种混合多云数据分析平台,它统一了数据仓库、数据湖、分析和新数据源。它结合了开源技术和商用技术以获取洞察力,可解决业务问题,支持描述性、预测性和规范性分析,并使用工作负载管理和自适应优化,为高查询并行性的混合工作负载提供性能。天睿Vantage整合多种分析语言,包括SQL、R、Python、SAS和Java,并支持各种类型的数据,包括JSON、Avro、Parquet、关系数据、空间数据和暂态数据。

客户喜欢天睿Vantage的混合云平台、可靠性、数据科学、高级分析以及基础架构易管理性。主要的使用场景包括BI加速、客户智能、实时分析、嵌入式数据科学功能、欺诈检测、时序分析、数据湖集成、数据仓库现代化以及数据服务。


Snowflake扩大产品种类,以支持更多的使用场景。

Snowflake Data Cloud支持数据仓库、数据湖、数据工程、数据科学深、数据应用开发和数据共享。Snowflake Data Cloud是一种全面管理的服务,使用SQL数据库引擎,可独自扩展存储和计算资源。Snowflake跨多个公共云及地区提供单一的无缝体验。它使技术用户和业务用户可以发现、共享以及使用与客户、供应商和合作伙伴共享的数据。

客户喜欢Snowflake的计算和存储相分离,以及可扩展性、时间旅行功能、易管理性、跨多个业务部门共享数据以及稳定性能。主要的使用场景包括BI加速、客户智能、基于AI/机器学习的分析、数据科学、数据仓库现代化、数据协作以及数据服务。

Oracle改进自主功能,以简化所有部署。

Oracle Autonomous Data Warehouse是一种云数据仓库服务,简化了数据仓库的供应、配置、安全、调优、补丁和管理。Oracle Cloud Data Warehouse在Oracle公共云中运行,支持共享和专用的基础架构和客户数据中心。为确保稳定的性能和规模,Oracle Autonomous Data Warehouse在Exadata Database设备上运行。Oracle提供简化的数据库迁移、内置基于Web的notebook、广泛的SQL访问、弹性规模扩展和并发工作负载。

客户喜欢Oracle的自主功能、快速实现价值、良好的性能及规模、易配置性、良好的安全和集成服务。主要的使用场景包括数据仓库现代化、基于AI/机器学习的分析、BI加速、物联网分析和实时分析。

强劲表现者



Cloudera通过自动化简化大规模分析。

Cloudera数据平台(CDP)跨混合环境和多云支持完整的数据生命周期生态系统,提供一种共享数据体验。Cloudera Data Warehouse与CDP全面集成,可提供易于使用的大规模自助式和高级分析使用场景。它支持自动配置、云优化、自助式工作负载管理以及自动扩展等功能。

客户喜欢Cloudera的业务价值、合作伙伴生态系统、低成本、数据治理、良好自动化和解决方案灵活性。主要的使用场景包括BI加速、客户智能、实时BI、基于AI/机器学习的分析、数据科学、数据仓库现代化以及数据服务。


Micro Focus提供低成本可靠的分析平台。

Vertica是一种统一分析仓库,结合了大规模并行处理(MPP)查询引擎和内置的高级分析及机器学习功能。Vertica的Eon Mode将计算与存储分开来,使用低成本S3对象存储以及针对变化的工作负载提供计算资源以优化分析性能的功能。Vertica Analytics可在各大公共云和本地环境中运行。它提供了良好的规模、性能、高级压缩、高级索引以及工作负载管理。

客户喜欢Vertica的可靠性、易用性、低成本、业务价值、内置的机器学习及分析功能、地理空间功能、技术支持以及混合云架构。主要的使用场景包括BI加速、客户智能、数据科学、实时分析以及数据协作。


SAP推出一款切实可行的产品,加入云数据仓库市场。

SAP Data Warehouse Cloud是一种现代化的统一数据及分析解决方案,提供了数据仓库即服务层,让你能够连接、转换、建模和直观显示数据,并获得实时洞察力。它建立在SAP HANA Cloud上,该云提供广泛的数据管理功能,包括数据转换、虚拟化、集成、目录、建模和元数据管理。它支持小组通过虚拟工作空间来协作,那样你可以使用同样的数据集,并与别人共享发现的结果。

客户喜欢SAP的发布频次、技术支持、易用性、建立通用语义层、业务价值以及与企业资源规划(ERP)数据集成。主要的使用场景包括 BI加速、客户智能、数据仓库现代化、实时分析、数据协作及共享以及数据服务。


阿里云有一款切实可行的分析解决方案,面向全球使用场景。

阿里云提供众多的基础架构、平台和分析服务,包括MaxCompute、AnalyticDB和DataWorks服务,以支持各种大规模数据仓库使用场景。虽然阿里的云数据仓库大多数部署在中国,但MaxCompute、AnalyticDB和DataWorks在16个国家和地区可用,客户遍布金融、互联网、生物医疗、能源、交通运输和媒体等行业。阿里巴巴的MaxCompute、AnalyticDB和DataWorks共同提供实时和EB级功能,支持任何数据仓库功能。

客户喜欢阿里云CDW解决方案的多种计算模式、机器学习功能、地理分布式平台、技术支持、业务价值、工具以及高端可扩展性。主要的使用场景包括BI加速、基于AI/机器学习的分析、数据仓库现代化、数据科学以及实时及风险分析。


IBM提供一种稳定、可靠、灵活的云数据仓库。IBM Db2 Warehouse on Cloud是一种弹性、全面管理的云数据仓库,提供了独立扩展存储和计算资源的功能。IBM以数据库内分析、实时数据流、自动化资源管理、垂直领域数据模型、安全以及与Spark和Hadoop平台集成而著称。IBM的主要优点在于混合数据管理平台、高度优化的列式数据存储、可行性压缩以及提供各种分析和机器学习工作负载的内存中处理。

客户喜欢IBM灵活的基础架构平台、稳定性、监控仪表板、可靠性、供应商支持和良好的可扩展性。主要的使用场景包括数据科学、数据仓库现代化、数据协作、客户智能以及BI加速。


Exasol为BI提供一种全面的解决方案。Exasol是一种全面管理、面向列的数据仓库,支持实时分析使用场景。虽然Exasol旨在在内存中运行,但数据写入到磁盘中确保持久化,并符合ACID。该平台有自我调优功能,可优化性能,并尽量降低维护需求。它还提供了直接在数据库中整合AI、机器学习和BI,以实现标准分析和高级分析的功能,使用任何数据科学语言。Exasol支持SQL,可使用ODBC、JDBC、ADO.NET或SDK来集成。

客户喜欢Exasol的内存中性能、可靠性、BI平台、低维护、更快速地创造价值、低成本以及易用性。主要的使用场景包括BI加速、基于AI/机器学习的分析、数据科学以及实时分析。

竞争者


Yellowbrick提供一种切实可行的混合云数据仓库。Yellowbrick Data Warehouse是一种提供全面服务的MPP分析数据库,可在公共云(AWS、谷歌云平台和微软Azure)和本地环境中运行。它提供原生实时数据流摄取、跨数据中心的混合云地理复制、SQL访问以及运营简洁性。Yellowbrick可同时访问来自多个公共云的数据,为敏感数据提供私有网络,并针对不同部署拥有同一个云控制平台。Yellowbrick的自愈合功能让数据仓库可以在遇到特定的技术问题后自动恢复,降低了停运风险。

客户喜欢Yellowbrick的低成本 、与合作伙伴集成、地理灵活性、易部署性以及良好的性能和规模。主要的使用场景包括BI加速、客户智能、数据仓库现代化、实时分析以及数据协作。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存